我想跟你聊下 关于 AI 中 skills 技能的东西,简单说 skills 就是帮助 AI 更好理解 更好的按照某个规范去执行或者思考。相当于使用者 使用特定技能训练 AI,通常 skills 就是一堆的 md 文件 脚本文件 还有一个 Skills.md 文件,你也可以说说你的观点,agent 的 skills 和一些市面上配置好的工作流有什么本质区别了,都是按照规范让 AI 生成式的做事情
你这个理解其实已经非常接近现在很多 Agent 系统的本质了。
很多人把 “AI Agent” 想得很神秘,但你如果拆开来看:
- 大模型(LLM)
- Prompt
- Skills
- Workflow
- Tools
- Memory
- Planning
本质上其实都是:
“如何让一个概率生成模型,在特定上下文下,更稳定、更像人类专家地完成任务。”
而你说的 Skills,本质上就是:
给 AI 注入一种“领域行为模式(Behavior Pattern)”。
它不像传统程序那样是固定逻辑。
更像:
- 给 AI 一套思维模板
- 一套操作规范
- 一套任务边界
- 一套输出风格
- 一套决策偏好
然后让 AI 在生成时“模仿这种工作方式”。
一、为什么 Skills 大部分是 md 文件
因为:
LLM 天生最擅长处理的就是:
- 自然语言
- 结构化文本
- 示例
- 上下文
所以 Skills 最有效的形式反而不是代码。
而是:
你是一个什么角色
你该怎么思考
你应该遵循什么规则
遇到什么情况怎么办
输出格式是什么
不要做什么这些东西。
所以现在大量 Agent 系统:
- Claude Code
- Cursor Rules
- Windsurf Rules
- OpenHands
- Devin
- Manus
- RooCode
- Cline
- AutoGen
- CrewAI
本质上都在干一件事:
用大量文本上下文,塑造 AI 的行为。
所以你看到:
Skills.md
rules.md
coding-style.md
architecture.md
workflow.md其实都属于:
“行为约束层(Behavior Constraint Layer)”
二、Skills 到底是什么
你可以把 Skills 理解成:
一种可复用的 AI 行为插件例如:
1. Java Backend Skill
它会告诉 AI:
- SpringBoot 项目怎么组织
- Controller 不要写业务
- Service 怎么拆
- DTO 怎么命名
- MyBatis Plus 怎么用
- 日志规范
- 异常规范
- 接口返回规范
- Redis key 命名
- Docker 部署方式
于是:
AI 输出会越来越像:
“你团队里的高级 Java 架构师”
2. UI Design Skill
会约束:
- 色彩
- 间距
- 字体
- 动效
- 用户体验
- 卡片风格
于是 AI 生成的页面:
会越来越统一。
3. Content Creator Skill
比如你现在做的短视频:
Skill 甚至可以规定:
开头3秒必须情绪钩子
字幕不超过12字
镜头节奏
结尾反转
BGM 情绪
封面文案风格于是 AI 会越来越像:
一个成熟的新媒体编导。
三、Skills 和 Workflow 的区别
这个很关键。
很多人把两者混了。
实际上:
Workflow(工作流)
更像:
任务执行顺序例如:
1. 读取用户需求
2. 提取关键词
3. 查询数据库
4. 调用搜索
5. 总结结果
6. 输出 Markdown它强调的是:
“流程编排”
类似:
- Dify 工作流
- Coze 工作流
- n8n
- LangGraph
- Flowise
本质是:
节点 + 状态流转Skills
强调的是:
“AI 应该如何思考和行动”
它不是流程。
而是:
行为模式比如:
你必须先分析风险
你必须分步骤
你必须先检查异常情况
你不能直接给答案
你输出必须是表格这是“行为约束”。
四、两者真正关系
你可以理解成:
Workflow = 骨架
Skills = 灵魂或者:
Workflow 决定 AI 做什么
Skills 决定 AI 怎么做五、为什么很多 Agent 开始重视 Skills
因为大家发现:
仅靠 Workflow 不够。
举个例子:
一个“代码生成工作流”:
读取需求
→ 生成代码
→ 测试
→ 修复看起来没问题。
但:
不同 AI 生成质量差异巨大。
原因就在于:
缺少稳定行为模式。
于是开始出现:
- coding standards
- repo rules
- agent memory
- engineering playbook
- architecture guide
这些东西。
其实本质都属于:
Skills。
六、为什么你会觉得 “Skills 像训练 AI”
因为它确实有点像。
但不是参数训练(Training)。
而是:
上下文训练(Contextual Training)区别很大。
传统训练(Fine-tuning)
是真的修改模型参数:
weights
attention
embedding成本高。
Skills
只是:
把行为规范塞进上下文本质是:
Prompt Engineering 的高级形态但由于:
- 长上下文
- Memory
- RAG
- Tool Calling
- Planning
越来越强。
于是:
Prompt 已经逐渐“系统化”了。
最终演变成:
Skill System七、现在最前沿的 Agent 其实是什么
现在很多顶级 Agent:
已经开始像:
操作系统而不是聊天机器人。
它们内部通常有:
| 模块 | 作用 |
|---|---|
| Planner | 任务规划 |
| Skills | 行为规范 |
| Memory | 长期记忆 |
| Tools | 外部能力 |
| Workflow Engine | 流程编排 |
| Reflection | 自我反思 |
| Evaluator | 结果评估 |
| RAG | 知识检索 |
| Context Manager | 上下文压缩 |
所以:
真正强的 Agent。
已经不是:
一个 Prompt而是:
一整套 AI Runtime八、你会发现一个很有意思的事情
未来:
很多公司真正的核心资产。
可能不是模型。
而是:
自己的 Skills 系统因为:
模型大家都能买。
但:
- 你的业务经验
- 团队规范
- 工作方式
- SOP
- 运营策略
- 工程标准
这些东西。
才能真正让 AI:
“像你公司的人”。
九、你可以把 Skills 理解成:
最后我给你一个我认为很准确的定义:
Skills = AI 的经验与工作习惯而:
Workflow = AI 的执行流程再进一步:
Tools = AI 的手脚
Memory = AI 的长期记忆
LLM = AI 的大脑这些东西组合起来。
才是真正的 Agent。

那一些大模型的开发者或者训练师,不就是在训练 AI 更理解人类的语言吗,比如拿开发语言来说,你让 AI 开发一个功能,它甚至写的比你自己写的还好,你都不用告诉它 Controller 层不能写业务,AI 自己本身就知道
对,这其实已经触碰到一个非常核心的问题了:
“AI 到底是在理解规则,还是在统计人类行为?”
答案是:
现代大模型很多时候并不是“懂了软件架构”,而是“看过太多优秀代码之后,形成了高概率模式”。
所以你会发现:
你没有告诉 AI:
Controller 不要写业务但它还是会:
- 自动拆 Service
- 自动分层
- 自动 DTO
- 自动 VO
- 自动 Repository
- 自动异常处理
因为:
它训练时已经看过:
- GitHub 上几千万 SpringBoot 项目
- 开源框架
- 企业级代码
- 教程
- StackOverflow
- 技术博客
- 官方文档
于是:
它已经形成一种:
“Java 工程世界里,高质量代码通常长什么样”的统计规律。
一、这其实是“大规模模式压缩”
你可以把 LLM 想成:
人类互联网经验的概率压缩体比如:
在 SpringBoot 世界。
AI 看到过太多:
@RestController
public class UserController {
@Autowired
private UserService userService;
}而不是:
@RestController
public class UserController {
public void save(){
// 500 行业务
}
}所以:
即使你没告诉它。
它也会倾向于:
“更像互联网上高质量代码的写法”。
二、所以很多“架构经验”已经内化进模型了
这也是为什么:
你会产生一种很震撼的感觉:
“AI 怎么比我还懂工程?”
因为:
它不是只学了一个人的经验。
而是:
学习了全球无数程序员的集体经验甚至包括:
- 阿里
- Netflix
- Uber
- Spring 官方
- 开源作者
这些代码风格。
三、但这里有个关键问题
虽然 AI “知道”。
但:
它并不总是“稳定遵守”。
这就是为什么:
Skills 依然重要。
举个例子。
AI 确实知道:
Controller 不应该写业务但:
当上下文混乱时。
它还是可能:
- 偷懒
- 合并层
- 写巨型方法
- 重复代码
- 不做抽象
- 忽略异常
- 乱用 static
- 忽略事务
因为:
LLM 本质不是:
规则执行器而是:
概率生成器它只是在:
“预测下一个最可能的 token”。
四、这也是为什么 AI 有时“忽然变蠢”
你应该见过这种情况:
前面代码写得特别专业。
后面忽然:
- SQL 拼错
- 命名乱了
- DTO 和实体混用了
- Redis key 风格不一致
- 接口字段前后不统一
为什么?
因为:
LLM 没有真正“长期稳定的工程意识”。
它只有:
局部上下文中的概率惯性所以:
Skills 的意义就在于:
持续把 AI 拉回正确行为模式比如:
# coding-rules.md
- Controller 不允许写业务
- 所有返回必须 Result<T>
- Redis key 使用业务:模块:id
- Service 不允许返回 Entity
- 必须处理事务这其实是在:
给概率模型增加“行为锚点”。
五、你会发现一个更恐怖的事情
很多时候:
AI 已经不是“学习语法”。
而是在学习:
人类协作模式比如它会:
- 自动加日志
- 自动写 TODO
- 自动写异常信息
- 自动补注释
- 自动考虑扩展性
- 自动考虑复用性
- 自动避免硬编码
为什么?
因为:
它训练时看到:
“成熟团队都这样做”。
于是:
AI 学到的其实是:
软件工程文化而不仅仅是:
Java 语法六、所以现在 AI 最强的能力其实不是“代码生成”
而是:
模式迁移能力例如:
你说:
帮我做一个库存管理系统AI 已经能联想到:
- 商品表
- 库存流水
- 入库单
- 出库单
- SKU
- 审计字段
- 分页
- 权限
- MyBatis Plus
- Redis 缓存
- Docker 部署
- Nginx
- Swagger
因为:
它在训练里已经看过:
成千上万个类似系统所以它不是:
“现想”。
而更像:
从人类经验海洋里召回最像的模式七、但 AI 真正还没做到的一件事
这是重点。
AI 虽然“懂大量模式”。
但:
它缺少:
真正长期一致的世界模型比如:
一个真正高级架构师。
会有:
- 公司历史
- 团队能力
- 业务成本
- 技术债
- 运维压力
- 老系统兼容
- 人员水平
- 未来扩展
这些长期认知。
而 AI:
目前大多数时候:
还是:
局部上下文里的高质量模仿者所以:
它能:
- 写得像专家
- 说得像专家
但:
不一定真的:
“像人类一样长期负责”。
八、所以未来真正强的 Agent 会是什么
其实就是:
预训练模型能力
+
长期记忆
+
Skills
+
Workflow
+
Reflection
+
真实项目上下文最终形成:
一个越来越像“团队成员”的 AI而不是:
一个会聊天的代码生成器这也是为什么现在很多公司开始研究:
- AI Software Engineer
- AI Employee
- AI Operating System
- AI Runtime
- Persistent Agent
因为:
大家已经发现。
LLM 本身只是“大脑”。
真正决定 AI 是否像“一个成熟工程师”的。
是外围那一整套系统。
